<!DOCTYPE html>
<html lang="ja">

<head>
  <meta charset="utf-8">
  <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
  <meta http-equiv="Content-Style-Type" content="text/css">
  <script src='../bbs.js'></script>

  <!-- Global site tag (gtag.js) - Google Analytics -->
  <script async src="https://www.googletagmanager.com/gtag/js?id=UA-120820034-1"></script>

  <link href="../bbs.css" type="text/css" rel="stylesheet">
  <link rel="shortcut icon" href="/favicon.ico">
  <title>UTF-8文字化け | サクラエディタ過去ログ</title>
</head>
<body>
<ul class="side">
        <a href="./" class="toindex">◀一般トップへ</a>
        <li><div class="list-title">
    <span class="no">3247</span>
    <a class="thread-title" href="3247.html#3247">UTF-8文字化け</a></div>
    <ul><li><div class="list-title">
    <span class="no">3252</span>
    <a class="thread-title" href="3247.html#3252">Re: UTF-8文字化け</a></div>
    <ul><li><div class="list-title">
    <span class="no">3358</span>
    <a class="thread-title" href="3247.html#3358">Re2: UTF-8文字化け</a></div>
    </li></ul></li><li><div class="list-title">
    <span class="no">3253</span>
    <a class="thread-title" href="3247.html#3253">ファイル送って下さい</a></div>
    <ul><li><div class="list-title">
    <span class="no">3254</span>
    <a class="thread-title" href="3247.html#3254">Re:ファイル送って下さい</a></div>
    <ul><li><div class="list-title">
    <span class="no">3255</span>
    <a class="thread-title" href="3247.html#3255">16進の3バイト</a></div>
    <ul><li><div class="list-title">
    <span class="no">3256</span>
    <a class="thread-title" href="3247.html#3256">Re:16進の3バイト</a></div>
    <ul><li><div class="list-title">
    <span class="no">3262</span>
    <a class="thread-title" href="3247.html#3262">「～」と「～のようなもの」は別字なのだ</a></div>
    </li></ul></li></ul></li></ul></li></ul></li></ul></li>
    </ul><ul class="main"><li><section><h1 id=3247>
    <span class="no">[3247]</span>
    <a class="thread-title" href="#3247">UTF-8文字化け</a>
    <span class="author">佐野剛史</span>
    <time datetime="2003-09-05T08:59:37">2003年09月05日 08:59</time></h1>
    <div class="body">サクラエディタでUTF-8でエンコードされている<br>テキストを開くと、「&amp;#12316;」（～のような<br>文字）の文字が文字化けします。これはバグで<br>しょうか。<br><br>具体的には、<br><br>Ruby Way ～Ruby道への招待～<br><br>が<br><br>Ruby Way 縲彝uby道への招待縲<br><br>になります。<br></div></section>
    <ul><li><section><h1 id=3252>
    <span class="no">[3252]</span>
    <a class="thread-title" href="#3252">Re: UTF-8文字化け</a>
    <span class="author">もか</span>
    <time datetime="2003-09-05T16:15:38">2003年09月05日 16:15</time></h1>
    <div class="body">&gt;サクラエディタでUTF-8でエンコードされているテキストを開くと、<br>&gt;「&amp;#12316;」（～のような文字）の文字が文字化けします。<br>まず、断っておかないといけないのは、サクラエディタは内部コードがSJISなのでSJISに含まれない文字は利用できません。<br><br>サクラエディタではUnicode文字列とCP932(Shift_JIS)の変換に、MSのテーブル=対応表を使っています。<br>今回の文字は&amp;#12316;でU+301C(WAVE DASH)です。<br>本来の対応:0x8160←→U+301C<br>ですので本来は「～のような文字」ではなく、「～そのもの」のはずなんですが、<br>MSの対応:0x8160←→U+FF5E(FULLWIDTH TILDE)<br>となっていて、肝心のU+301Cはというと、“対応するSJISコードは無し”です。<br>そのため、現在のサクラエディタでは扱えない文字と言うことになってしまっています。<br><br>&gt;これはバグでしょうか。<br>MSのバグ(仕様)です。今後修正される見込みはまずないでしょう。<br>しかし、この文字に限ればサクラエディタで独自に対応することは不可能ではないです。<br></div></section>
    <ul><li><section><h1 id=3358>
    <span class="no">[3358]</span>
    <a class="thread-title" href="#3358">Re2: UTF-8文字化け</a>
    <span class="author">蒔田　信幸</span>
    <time datetime="2003-10-10T23:00:11">2003年10月10日 23:00</time></h1>
    <div class="body">「逆～」は、例えば、Google で、<br>「site:info-price.jp 秋葉原」<br>を検索すると表示される。<br><br>Windowsのどこかには、フォントが有るはずなのです！</div></section>
    </li></ul></li><li><section><h1 id=3253>
    <span class="no">[3253]</span>
    <a class="thread-title" href="#3253">ファイル送って下さい</a>
    <span class="author">渡辺真</span>
    <time datetime="2003-09-05T16:57:50">2003年09月05日 16:57</time></h1>
    <div class="body">既に、もか さんから回答有りましたが、私の環境では、うまく再現しません。<br><br>後学のために、サンプルファイルを送って下さい。<br></div></section>
    <ul><li><section><h1 id=3254>
    <span class="no">[3254]</span>
    <a class="thread-title" href="#3254">Re:ファイル送って下さい</a>
    <span class="author">蒔田　信幸</span>
    <time datetime="2003-09-06T11:01:24">2003年09月06日 11:01</time></h1>
    <div class="body">▼ 渡辺真さん　質問で申し訳ありません<br>&gt; 既に、もか さんから回答有りましたが、私の環境では、うまく再現しません。<br>&gt; <br>&gt; 後学のために、サンプルファイルを送って下さい。<br><br>U301C は、１６進の３バイトで表すと何になるのですか。</div></section>
    <ul><li><section><h1 id=3255>
    <span class="no">[3255]</span>
    <a class="thread-title" href="#3255">16進の3バイト</a>
    <span class="author">渡辺真</span>
    <time datetime="2003-09-06T13:39:20">2003年09月06日 13:39</time></h1>
    <div class="body">サンプルファイルをもらっていないので分かりませんが、<br><br>わたしの環境では、掲示板の文字「～」をSakuraに張り付けて、UTF-8で保存すると、<br><br>EFBD9E<br><br>になって、開き直すと「～」に戻って文字化けしません。</div></section>
    <ul><li><section><h1 id=3256>
    <span class="no">[3256]</span>
    <a class="thread-title" href="#3256">Re:16進の3バイト</a>
    <span class="author">蒔田　信幸</span>
    <time datetime="2003-09-06T16:36:35">2003年09月06日 16:36</time></h1>
    <div class="body">▼ 渡辺真さん<br>それなら、<br>U301C = E3809C どこどこからのような記号<br><br>x01x     00 0000   01<br>x809x -1000 0000-1001<br>○エディタで表示しました。<br><br>U9053 = E98193 道<br>      = E381B8 へ<br>      = E381AE の<br>U62DB = E68B9B 招<br>U5F85 = E5BE85 待<br>UFF5E = EFBD9E ～<br><br>05     00 0001   01<br>819 -1000 0001-1001<br><br>2D     00 1011   01<br>8B9 -1000 1011-1001<br><br>F8     11 1110   00<br>BE8 -1011 1110-1000<br><br>F5     11 1101   01<br>BD9 -1011 1101-1001<br><br>301C   =      0011   00 0000   01 1100<br>E3809C =-1110 0011-1000 0000-1001 1100<br>         ^^^^ ３バイトだから１が３個並んで０<br><a href=http://www.okinawa.oiu.ac.jp/okinawa-cgi/cgi-bin/uni-kanji/unicode.htm target=_top><nobr>http://<wbr>www.<wbr>okinawa.<wbr>oiu.<wbr>ac.<wbr>jp/<wbr>okinawa-<wbr>cgi/<wbr>cgi-<wbr>bin/<wbr>uni-<wbr>kanji/<wbr>unicode.<wbr>htm</nobr></a><br>と、まあこんな感じです。（暑）<br>以上<br><br>&gt; しかし、この文字に限ればサクラエディタで独自に対応<br>&gt; することは不可能ではないです。<br>特殊記号の入力もしくは、コードの逆変換が出来ないので、<br>大変更だと思います。いっその事、U301CとUFF5Eを交換しますか？(汗)</div></section>
    <ul><li><section><h1 id=3262>
    <span class="no">[3262]</span>
    <a class="thread-title" href="#3262">「～」と「～のようなもの」は別字なのだ</a>
    <span class="author">渡辺真</span>
    <time datetime="2003-09-08T12:15:36">2003年09月08日 12:15</time></h1>
    <div class="body">しつこくお付き合いいただき、有難うございました。<br><br><a href=http://www.unicode.org/charts/PDF/U3000.pdf target=_top><nobr>http://<wbr>www.<wbr>unicode.<wbr>org/<wbr>charts/<wbr>PDF/<wbr>U3000.<wbr>pdf</nobr></a><br><br>の解説を見て、やっと理解しました。(^^ゞ<br><br>山谷の「～」は、U+FF5E(FULLWIDTH TILDE)で<br><br>「～の位相のずれた谷山」は、U+301C(WAVE DASH)なんですね。<br><br>&gt;サクラエディタで独自に対応<br>してもらって、<br>U+301C→0x8160<br>U+FF5E→0x8160<br>の両刀使いが、ファジィで良いと思います。(汗)<br></div></section>
    </li></ul></li></ul></li></ul></li></ul></li></ul></li></ul></body></html>